智能论文笔记

Individual health-disease phase diagrams for disease prevention based on machine learning

Kazuki Nakamura , Eiichiro Uchino , Noriaki Sato , Ayano Araki , Kei Terayama , Ryosuke Kojima , Koichi Murashita , Ken Itoh , Tatsuya Mikami , Yoshinori Tamada

分类：机器学习 | 人工智能

2022-05-31

基于有效干预措施的早期疾病检测和预防方法正在引起人们的注意。机器学习技术通过捕获多元数据中的个体差异来实现精确的疾病预测。精确医学的进展表明，在个人层面的健康数据中存在实质性异质性，并且复杂的健康因素与慢性疾病的发展有关。但是，由于多种生物标志物之间的复杂关系，确定跨疾病发作过程中的个体生理状态变化仍然是一个挑战。在这里，我们介绍了健康疾病阶段图（HDPD），它通过可视化在疾病进展过程早期波动的多种生物标志物的边界值来代表个人健康状态。在HDPD中，未来的发作预测是通过扰动多个生物标志物值的情况来表示的，同时考虑变量之间的依赖性。我们从3,238个个体的纵向健康检查队列中构建了11种非传染性疾病（NCD）的HDPD，其中包括3,215个测量项目和遗传数据。 HDPD中非发病区域的生物标志物值的改善显着阻止了11个NCD中的7个未来的疾病发作。我们的结果表明，HDPD可以在发作过程中代表单个生理状态，并用作预防疾病的干预目标。

translated by 谷歌翻译

Cross-Modal Similarity-Based Curriculum Learning for Image Captioning

Hongkuan Zhang , Saku Sugawara , Akiko Aizawa , Lei Zhou , Ryohei Sasano , Koichi Takeda

分类：计算机视觉 | 自然语言处理

2022-12-14

Image captioning models require the high-level generalization ability to describe the contents of various images in words. Most existing approaches treat the image-caption pairs equally in their training without considering the differences in their learning difficulties. Several image captioning approaches introduce curriculum learning methods that present training data with increasing levels of difficulty. However, their difficulty measurements are either based on domain-specific features or prior model training. In this paper, we propose a simple yet efficient difficulty measurement for image captioning using cross-modal similarity calculated by a pretrained vision-language model. Experiments on the COCO and Flickr30k datasets show that our proposed approach achieves superior performance and competitive convergence speed to baselines without requiring heuristics or incurring additional training costs. Moreover, the higher model performance on difficult examples and unseen data also demonstrates the generalization ability.

translated by 谷歌翻译

Unsupervised vocal dereverberation with diffusion-based generative models

Koichi Saito , Naoki Murata , Toshimitsu Uesaka , Chieh-Hsin Lai , Yuhta Takida , Takao Fukui , Yuki Mitsufuji

分类：机器学习

2022-11-08

Removing reverb from reverberant music is a necessary technique to clean up audio for downstream music manipulations. Reverberation of music contains two categories, natural reverb, and artificial reverb. Artificial reverb has a wider diversity than natural reverb due to its various parameter setups and reverberation types. However, recent supervised dereverberation methods may fail because they rely on sufficiently diverse and numerous pairs of reverberant observations and retrieved data for training in order to be generalizable to unseen observations during inference. To resolve these problems, we propose an unsupervised method that can remove a general kind of artificial reverb for music without requiring pairs of data for training. The proposed method is based on diffusion models, where it initializes the unknown reverberation operator with a conventional signal processing technique and simultaneously refines the estimate with the help of diffusion models. We show through objective and perceptual evaluations that our method outperforms the current leading vocal dereverberation benchmarks.

translated by 谷歌翻译

Implicit Neural Representations for Variable Length Human Motion Generation

Pablo Cervantes , Yusuke Sekikawa , Ikuro Sato , Koichi Shinoda

分类：计算机视觉

2022-03-25

我们提出了一种使用变异隐式神经表示（INR）的动作条件人类运动产生方法。变分形式主义可以使INR的动作条件分布，从中可以轻松地采样表示形式以产生新的人类运动序列。我们的方法通过构造提供可变的长度序列生成，因为INR的一部分已针对随时间嵌入的整个任意长度进行了优化。相反，以前的作品报告了建模可变长度序列的困难。我们证实，使用变压器解码器的方法优于人类Act12，NTU-RGBD和UESTC数据集的所有相关方法，从现实主义和生成动作的多样性方面。令人惊讶的是，即使我们使用MLP解码器的方法也始终优于最先进的基于变压器的自动编码器。特别是，我们表明，在现实主义和多样性方面，我们方法生成的可变长度运动比最先进方法产生的固定长度运动更好。 https://github.com/pacerv/implicitmotion上的代码。

translated by 谷歌翻译

Variational Inference with Gaussian Mixture by Entropy Approximation

Takashi Furuya , Hiroyuki Kusumoto , Koichi Taniguchi , Naoya Kanno , Kazuma Suetake

分类： (统计)机器学习 | 机器学习

2022-02-26

变异推断是一种近似顽固性后验分布的技术，以量化机器学习的不确定性。尽管通常选择单峰高斯分布作为参数分布，但几乎不能近似多模式。在本文中，我们将高斯混合物分布作为参数分布。高斯混合物的变异推断的主要难度是如何近似高斯混合物的熵。我们将高斯混合物的熵近似为单峰高斯的熵之和，可以在分析上计算。此外，我们理论上分析了真熵与近似熵之间的近似误差，以揭示我们的近似何时效果很好。具体而言，近似误差由平均值与高斯混合物方差之和之间的距离之比控制。此外，当比率变为无穷大时，它会收敛到零。由于维度的诅咒，这种情况似乎更有可能在更高维度的参数空间中发生。因此，我们的结果保证了我们的近似效果很好，例如，在具有大量权重的神经网络中。

translated by 谷歌翻译

Comparison and Combination of Sentence Embeddings Derived from Different Supervision Signals

Hayato Tsukagoshi , Ryohei Sasano , Koichi Takeda

分类：自然语言处理

2022-02-07

句子嵌入方法有许多成功的应用。但是，根据监督信号，在结果句子嵌入中捕获了哪些属性。在本文中，我们专注于具有相似体系结构和任务的两种类型的嵌入方法：一种关于自然语言推理任务的微型预训练的语言模型，以及其他微型训练的训练语言模型在单词预测任务上根据其定义句子，并研究其属性。具体而言，我们使用两个角度分区的STS数据集比较他们在语义文本相似性（STS）任务上的性能：1）句子源和2）句子对的表面相似性，并在下游和探测任务上比较其表现。此外，我们尝试结合两种方法，并证明将两种方法组合起来比无监督的STS任务和下游任务的各自方法的性能要好得多。

translated by 谷歌翻译

Attempt to Predict Failure Case Classification in a Failure Database by using Neural Network Models

Koichi Bando , Kenji Tanaka

分类：机器学习

2021-08-29

随着最近的信息技术进步，网络信息系统的使用迅速扩展。银行和公司之间的电子商务和电子支付，以及公众使用的在线购物和社交网络服务是此类系统的示例。因此，为了维护和提高这些系统的可靠性，我们正在构建来自过去故障情况的故障数据库。将新故障案例导入数据库时，必须根据失败类型对这些情况进行分类。问题是分类的准确性和效率。特别是在使用多个个人时，需要统一分类。因此，我们试图使用机器学习自动化分类。作为评估模型，我们选择了多层的Perceptron（MLP），卷积神经网络（CNN）和经常性神经网络（RNN），其是使用神经网络的模型。结果，在精度方面的最佳模型首先是CNN之后的MLP，并且分类的处理时间是实用的。

translated by 谷歌翻译

Case-based similar image retrieval for weakly annotated large histopathological images of malignant lymphoma using deep metric learning

Noriaki Hashimoto , Yusuke Takagi , Hiroki Masuda , Hiroaki Miyoshi , Kei Kohno , Miharu Nagaishi , Kensaku Sato , Mai Takeuchi , Takuya Furuta , Keisuke Kawamoto

分类：计算机视觉

2021-07-08

在本研究中，我们提出了一种基于病例的新型图像检索（SIR）方法，用于苏木精和曙红（H＆E）染色的恶性淋巴瘤的组织病理学图像。当将整个幻灯片图像（WSI）用作输入查询时，希望能够通过重点关注病理上重要区域（例如肿瘤细胞）中的图像斑块来检索相似情况。为了解决这个问题，我们采用了基于注意力的多个实例学习，这使我们能够在计算案例之间的相似性时专注于肿瘤特异性区域。此外，我们采用对比度距离度量学习将免疫组织化学（IHC）染色模式纳入有用的监督信息，以定义异质性恶性淋巴瘤病例之间的适当相似性。在对249例恶性淋巴瘤患者的实验中，我们证实该方法比基线基于病例的SIR方法表现出更高的评估措施。此外，病理学家的主观评估表明，我们使用IHC染色模式的相似性度量适用于代表恶性淋巴瘤H＆E染色组织图像的相似性。

translated by 谷歌翻译